В целом, было очевидно, что подобное сравнение показывает примерно ноль информации, кроме той, что метод сопряженных градиентов работает несравненно быстрее/выше/сильнее, чем метод градиентного спуска.

А вот тут уже поинтереснее сравнение, так как они делают плюс/минус одинаковое кол-во итераций, но обращений к ораулу и затраченное время у метода Ньютона заметно меньшее, чем у метода сопряженных градиентов, что не удивительно, так как внутри споряженных градиентов мы итеративно пытаемся приближенно решить задачу на поиск направления.

В целом, для *breast-cancer датасета картинка неизменилась